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摘要 ”在 经 过 长 期 运行 后 大 口径 射电 望远镜 俯仰 轴 会 
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元 远 镜 仿 仰 轴承 


出 现 微小 扭曲 , 滚动 轴承 作为 承载 俯仰 轴 的 核心 部 件 , 也 
会 因 长 期 承受 交 变 载荷 增加 疲劳 风险 , 导致 轴承 寿命 以 及 望远镜 指向 精度 的 下 降 , 极 大 影响 望远镜 的 性 能 . 以 俯 
仰 轴承 为 研究 对 象 , 开展 故障 辨识 方法 研究 , 可 为 望远镜 天 线 的 高 性 能 运行 提供 重 


BL. 为 实现 在 有 限 数据 


和 复杂 工作 条 件 下 准确 地 辨识 俯仰 轴承 故障 , 提出 了 一 种 小 样本 条 件 下 基于 元 学 习 的 故障 辨识 方法 (Few-shot 
Meta-learning Fault Identification, FMFI). 首先 将 不 同 工 况 下 的 原始 信号 转换 为 时 频 图 像 数据 , 之 后 按照 元 


学 习 协 议 将 数据 样本 随机 采样 到 不 同 的 学 习 任务 中 . 在 有 限 样本 的 条 件 下 , FMFI 可 以 通 


息 获 取 通 用 的 先 验 知识 , 在 未 知 的 测试 任务 下 实现 准 
以 性 的 变 负载 轴承 数据 集 进行 实验 , 实验 结果 表明 , FMFI 方 法 具有 很 高 的 准确 性 和 可 靠 性 , 为 大 口径 射电 望 远 


确 快速 的 故障 辨识 . 选 


过 
取 了 与 望远镜 俯仰 轴承 工 况 具有 相 


[训练 任务 中 的 样本 信 


镜 俯仰 轴承 的 主动 运 维和 高 质量 服役 提供 了 有 力 的 技术 支持 . 
关键 词 望远镜, 仪器 : 俯仰 轴承 , 方法 : 数据 分 析 , 方法 : 模式 识别 
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伴随 着 射电 望远镜 朝 着 大 口径 、 高 频段 的 方 
向 发 展 , 望远镜 的 指向 精度 越 来 越 高 , 这 对 设备 的 
精确 性 、 可 靠 性 的 要 求 越 来 越 严 苛 , 望远镜 结构 的 
稳定 性 对 望远镜 综合 性 能 的 影响 变 得 不 可 忽略 . 大 
口径 射电 望远镜 的 正常 运行 对 机 械 系 统 的 稳定 性 
和 所 用 部 件 的 质量 、 性 能 有 很 高 的 要 求 丰 ,俯仰 加 
承 作 为 支撑 和 稳定 天 线 的 关键 部 件 , 其 性 能 关系 到 
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并 且 望 远 镜 受 环 境 和 
经 过 长 期 运行 后 结构 


远 镜 的 观测 精度 和 结构 稳定 性 . 随 着 射电 望远镜 
径 的 不 断 增 大 , 望远镜 的 结构 重量 在 不 断 增 加 ， 


自身 重力 因素 影响 ,天线 


上 会 发 生 扭曲 , 产生 小 尺度 形 


变 , 导致 轴承 部 分 的 动态 承载 平衡 产生 变化 , 轴承 


安全 . 


结构 易 损 伤 , 降低 望远镜 性 能 甚至 危及 望远镜 结构 
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65 卷 天 
系统 设计 方面 61. 针对 望远镜 轴承 的 故障 辨识 
Fi 向 ， Rayo!’ 研究 了 甚大 望远镜 (Very Large Tele- 


scope, VLT) 中 的 旋转 机 械 结构 , 基于 时 域 和 频 域 
方法 分 析 了 该 结构 内 外 轴承 的 振动 特性 , 完成 了 旋 
转机 械 结 构 轴 承 部 分 的 故障 识别 , 为 VLT 的 运 维 提 
供 了 参考 . 在 轴承 故障 识别 领域 主流 方法 均 基于 机 
器 学 习 , 在 充足 的 样本 上 通过 分 析 处 理 得 到 特征 表 
AR, 实现 故障 的 识别 9， 


在 射电 望远镜 中 , 信仰 轴承 一 般 为 滚动 轴承 ， 
其 性 能 对 望远镜 的 高 精度 观测 至 关 重 要 . 望远镜 在 


运行 时 天 线 方位 和 俯仰 角 不 断 变化 , 并 且 望 远 镜 会 
受到 环境 以 及 自重 的 影响 , 长 时 间 的 运行 将 引起 天 
线 俯 仰 轴 微小 变形 , 导致 轴承 的 承载 特性 变化 , 产 
生 磨 损 和 其 他 失效 表现 , 影响 望远镜 的 精度 和 可 靠 
性 . 因此 对 俯仰 轴承 进行 故障 辨识 方法 研究 , 可 以 
及 时 发 现 和 解决 轴承 的 潜在 风险 , 保障 望远镜 的 正 
常 运行 和 观测 数据 的 准确 性 , 还 可 以 为 天 线 的 主动 
运 维和 观测 计划 的 调整 提供 重要 技术 支撑 , 为 俯仰 
承 有 效 服 役 甚至 超期 服役 提供 坚实 保障 . 

传统 的 机 器 学 习 方法 通常 需要 大 量 的 数据 训 
练 模型 , 然而 望远镜 天 线 机 械 系统 复杂 , 俯仰 轴承 
故障 样本 数量 有 限 , 采用 传统 的 机 器 学 习 方 法 难 
以 达到 理想 的 效果 . 为 应 对 这 一 挑战 , 结合 实际 的 
应 用 和 需求 , 本 研究 提出 了 一 种 小 样本 条 件 下 基 
于 元 学 习 的 故障 辨识 方法 (Few-shot Meta-learning 
Fault Identification, FMFI), 能 够 节省 人 工 辨 识 故 
障 的 成 本 , 并 且 克 服 传统 机 器 学 习 方 法 需要 大 量 数 
据 的 缺陷 , 实现 了 快速 准确 的 轴承 故障 辨识 . 


2 ”理论 背景 

小 样本 学 习 
小 样本 学 习 (Few-shot Learning, FSL) 通 过 模 
拟人 类 从 少量 样本 中 快速 搜索 特征 并 获取 知识 的 
学 习 概 括 能 力 , 能 够 在 有 限 样本 条 件 下 获得 高 准确 
度 的 模型 . 在 小 样本 学 习 中 , 通常 会 出 现 训练 数据 
和 测试 数据 领域 不 同 的 情况 , 其 中 训练 数据 来 自 源 
域 , 测试 数据 来 自 目 标 域 . 小 样本 学 习 方 法 针对 源 
域 数 据 样本 学 习 , 将 有 限 的 训练 样本 转化 至 通用 
的 特征 空间 , 获取 领域 知识 和 经 验 , 得 到 一 种 通用 


it 
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的 特征 表示 方法 , 侧重 于 应 用 知识 以 解决 新 的 问 
ENA, 在 面临 未 知 领域 的 测试 数据 时 , 根据 所 学 知 
识 , 通过 计算 新 样本 的 通用 特征 表示 , 实现 目标 域 
的 分 类 . 

传统 的 机 器 学 习 方法 一 般 是 针对 特定 数据 , 采 
用 专门 设计 的 算法 来 完成 固定 的 任务 . 其 训练 数据 
和 测试 数据 来 自 同一 领域 , 并 且 通 常 需要 大 量 的 数 
据 来 训练 模型 , 使 模型 在 测试 数据 上 具有 高 准确 
性 . 在 应 对 数据 样本 较 少 的 情况 时 , 采用 传统 的 机 


器 学 习 方 法 可 能 会 面临 过 拟 合 等 问题 , 导致 模型 无 
法 有 效 地 泛 化 到 新 数据 中 , 难以 达到 理想 的 分 类 和 
辨识 效果 . 


图 1 展示 了 不 同学 习 方 法 策略 , 其 中 X0 至 X6 分 
别 为 7 种 不 同类 别 的 数据 . 图 1 (a) 展 示 了 小 样本 学 
习 方法 的 学 习 策 略 , 训练 数据 和 测试 数据 的 数据 类 
型 不 同 , 且 数 据 量 有 限 . 图 1 (b) 展 示 了 传统 的 机 器 
学 习 方 法 的 学 习 策 略 , 训练 数据 和 测试 数据 的 数据 
类 型 相同 , 且 所 需 的 数据 量 较 多 . 


2.2 ”元 学 习 

元 学 习 (Meta Learning) 针 对 任务 进行 学 习 , 能 
够 开发 快速 有 效 地 适应 新 任务 的 模型 . 通过 在 一 组 
任务 上 训练 模型 , 使 其 学 习 一 套 更 普遍 的 知识 , 针 
对 多 个 任务 都 能 有 较 好 效果 , 并 在 面 对 未 知 的 新 任 
务 时 也 可 得 到 不 错 的 性 能 . 

元 学 习 的 每 个 学 习 任 务 均 包含 训练 数据 和 测 
斌 数据 . 给 定 元 模型 fj、 训练 任务 集 Dtsis、 测 试 任 
BSED tose, 每 个 任务 都 包含 作为 训练 数据 的 支撑 集 
DD 以 及 作为 测试 数据 的 查询 集 D5. 在 训练 阶段 ， 
第 i 个 任务 的 任务 模型 参数 更 新 以 及 性 能 评估 的 公 
式 表 述 如 (1) 式 和 (2) 式 所 示 . 


Ry 


(1) 
Piy = fe (DS), (2) 


EE DY, ALD, 5} Si SE Si ES BSC SA 
E, 0 为 更 新 前 的 任务 模型 参数 , w 为 模型 的 元 知 
识 , 儿 (D 交 ;0;;w) 为 模型 在 第 i 个 任务 的 损失 函数 ， 
0 为 任务 模型 参数 的 更 新 结果 ，Py。 为 模型 /使 用 任 
务 参数 0 在 查询 集 刀 多 中 的 性 能 度量 


= arg min 2 (D5; biw), 
0i 
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图 1 不同 学习 策略 的 示意 图 (a) 小 样本 学 习 ，(b) 传 统 的 机 器 学 习 . 


Fig.1 Diagram of different learning strategies. (a) Few-shot Learning, (b) Traditional Machine-Learning. 


模型 通过 学 习 所 有 训练 任务 , 获得 通用 的 知 
识 w. 在 面 对 测 试 任务 时 , 可 以 快速 适应 新 的 情况 . 


为 4 个 模块 : 轴承 数据 获取 模块 、 数 据 处 理 模 块 、 
任务 构建 模块 、 故 障 辨识 模块 . 轴承 数据 获取 模块 


本 研究 提出 的 FMFI 方 法 使 用 的 算法 是 作为 目 
前 元 学 习 方 法 中 最 具 代 表 性 的 与 模型 无 关 的 元 学 
习 算 法 (Model-Agnostic Meta-Learning, MAML), 
能 够 通过 对 极 少 样本 的 学 习 , 获得 跨 任务 的 概括 能 
FA, 从 而 快速 适应 新 的 情况 上 s- 芍 . 在 对 大 口径 射电 
望远镜 的 俯仰 轴承 进行 故障 辨识 时 , 基于 MAMIL 可 
以 在 有 限 样 本 的 条 件 下 , 提取 到 通用 的 故障 知识 ， 
实现 未 知 工 况 的 故障 辨识 . 


3 FMFI} 


AHH A BE W EAS E Bit OP EIT A 
承 的 故障 辨识 , 是 典型 的 小 样本 分 类 问题 . 由 于 传 
统 的 机 器 学 习 方法 难以 解决 , 为 此 本 文 利用 元 学 习 
方法 提出 了 基于 MAML 框 架 的 FMFI 方 法 . 
图 2 展示 了 FMFI 方 法 的 流程 ， 整 个 流程 分 


主要 用 于 获取 不 同 工 况 的 轴承 振动 状态 数据 . 数 
据 处 理 模块 将 采集 到 的 轴承 数据 划分 为 已 知 工 况 
数据 和 未 知 工 况 数据 , 分 别提 取 数 据 的 时 频 域 特 
征 . 任务 构建 模块 进一步 将 已 知 工 况 的 数据 特征 
转换 为 元 训练 集 , 未 知 工 况 的 数据 特征 转换 为 元 
测试 集 , 根据 元 学 习 的 N-way、 天 -shot 协 议 将 特征 
分 别 采样 至 不 同 的 任务 , 其 中 N-way 指 的 是 每 个 任 
务 的 训练 数据 中 有 个 类 别 , K-shot 指 每 个 类 别 下 
有 天 个 被 标记 数据 用 来 训练 , 称 为 当前 任务 的 支撑 
集 , 此 外 还 有 部 分 被 标记 数据 用 于 测试 , 称 为 当前 
任务 的 查询 集 . 假定 元 训练 集 包含 "个 任务 , 元 测 
WR Gn! MES, 二 者 支撑 集 的 故障 种 类 均 为 M， 
从 而 构建 FMFI 任 务 . 故障 辨识 模块 给 出 了 FMEFI 方 
法 的 网 络 模型 结构 , 基于 FMFI 方 法 通过 对 已 知 工 
况 的 轴承 样本 特征 的 学 习 获 取 元 知识 , 在 有 限 数 据 
样本 条 件 下 , 实现 未 知 工 况 的 俯仰 轴承 故障 辨识 . 
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Fig.2 The flowchart of FMFI method 


3.1 ”数据 处 理 

利用 加 速度 传感器 获取 轴承 振动 信号 后 , 采 
用 连续 小 波 变 换 (Continuous Wavelet Transform, 
CWT) 将 一 维 时 域 数据 转换 为 时 频 图 像 数 据 , 获得 
言 号 的 时 频 域 特征 . 

CWT 的 基本 原理 是 将 一 个 小 波 函 数 w(t) 不 断 
在 时 间 轴 和 尺度 轴 上 进行 平移 和 缩放 得 到 小 波 基 
PR Bp (其 公式 表述 如 下 : 


1 /tb 
ver) = 0 (=), (3) 
其 中 a 为 实现 小 波 伸 缩 变换 的 尺度 因子 , 5 为 实现 小 
波 移 位 变换 的 位 移 因 子 . 

2 Ay We HE PR Bp? (t) AY AS FEE R Be? (t) 5 
信号 进行 内 积 运算 , 可 以 得 到 一 系列 时 频 系数 . 给 
定 原始 信号 s(t), 其 小 波 变换 定义 为 : 


加 前 二 M y? (t)s(t)dt. (4) 


对 于 不 同 的 尺度 和 位 移 参数 , 可 得 到 一 系列 时 
PABLO (a, b), 这 些 时 频 系数 可 以 反映 信号 在 不 同 


时 间 和 尺度 上 的 能 量 分 布 , 进而 构成 信和 号 


图 . 


的 时 频 


CWT 具 有 可 变 分 辩 率 的 优点 , 能 够 更 好 地 捕 
捉 信号 中 的 瞬时 频率 变化 [9， 本 研究 采用 GWT 获 
取 时 频 图 像 . 时 频 图 像 如 图 2 右上 部 分 所 示 , 图 像 
的 z 轴 为 时 间 轴 , 代表 信号 的 时 域 变 化 ; y 轴 为 频率 
轴 , 代表 信号 的 频 域 变化 ; 图 像 的 亮度 颜色 深浅 代 
表 频 域 的 振幅 大 小 , 即 特定 时 间 和 频率 处 的 信号 强 
BE, 深 色 代表 高 能 量 , 浅 色 代表 低能 量 . 


3.2 ”任务 构建 


采用 基于 MAML 框 架 的 FMFI 方 法 在 有 限 样 本 
T a R, 需 根 据 元 学 习 框 
架 协议 的 特点 将 数据 集 划 分 为 包含 不 同类 型 故障 
的 小 样本 学 习 任 务 . 
N-way、K-shot 协 议 是 元 学 习 中 最 典型 的 任 
务 协议 , 它 定 义 了 如 何 划 分 数据 集 来 训练 元 学 习 模 
型 上 6. 在 训练 时 , 通常 会 从 数据 集 随机 选择 若干 任 
务 , 模型 在 支撑 集 上 进行 训练 , 在 查询 集 上 进行 评 
估 , 并 更 新 任务 模型 参数 , 以 适应 当前 任务 . 通过 这 
种 方式 , 模型 在 各 个 任务 的 不 断 迭 代 中 逐步 优化 ， 
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最 终 可 以 在 新 任务 上 进行 快速 、 高 效 的 学 习 . FMFI 分 别 基于 每 个 训练 任务 的 支撑 集 和 查询 集 进 
为 确保 FMFI 从 多 个 不 同 的 任务 中 学 习 到 通用 行内 外 循环 优化 , 从 而 更 新 模型 参数 9$. 在 元 测试 阶 
的 故障 信息 知识 , 使 用 已 知 和 全 新 工作 条 件 下 的 时 段 , FMFI 利 用 更 新 后 的 模型 参数 ,辨识 未 知 工 况 
频 图 像 构建 了 元 训练 、 元 验证 和 元 测试 集 . 在 训练 的 故障 . 
过 程 中 , 模型 需要 在 不 同类 型 的 任务 上 进行 训练 和 FMFI 在 元 训练 阶段 的 内 循环 中 , 会 利用 每 个 
调整 ,以 适应 不 同类 型 的 俯仰 轴承 故障 辨识 任务 . 任务 更 新 任务 模型 参数 , 逐步 优化 模型 . 在 处 理 任 
在 测试 过 程 应 用 于 未 见 过 的 新 轴承 故障 辨识 任务 . STW, 首先 根据 任务 的 支撑 集 D 和 ,采用 梯度 下 
3.3 ”网 络 结构 降 的 方式 计算 当 se WA BL, 
E ”关于 参数 的 梯度 , 进而 更 新 任务 模型 参数 . 损失 函 
MA 的 网 络 结构 主干 是 KL RA T 2E WIE Fie, 具体 公式 如 下 : 
竹简 上 


单 的 5 层 的 卷 积 神 经 网 络 (Convolutional 
Neural Network, CNN), 其 中 前 4 层 结构 基本 一 
致 , 均 由 卷 积 模块 、 批 归 一 化 模块 、 非 线性 变换 
模块 、 池 化 模块 4 种 基础 模块 构成 . FMFI 的 输入 
为 28 x 28 的 3 通道 RGB 时 频 图 像 , 每 层 结构 卷 积 模 
块 Conv 的 卷 积 核 大 小 为 (3,3), 池 化 模块 选择 最 大 
池 化 (Max-pool), 核 大 小 为 (2,2); 非 线 性 变换 模块 
采用 ReLU (Rectified Linear Unit) KA. 经 过 4 层 网 
络 之 后 , 利用 全 连接 层 实现 特征 和 标签 空间 之 间 的 
映射 , 之 后 通过 softmax 得 到 最 终 的 分 类 结果 . 由 于 
网 络 层 数 较 浅 ， 网 络 的 模型 参数 较 少 , 因此 收敛 性 
能 较 好 . FMFI 主 干 网 络 的 参数 设计 如 表 1 所 示 . 


#1 FMFI 主 干 网 络 的 参数 
Table 1 The parameters of FMFI backbone 


No. Layer Name Kernel Size Stride Padding 
1 Conv I (3, 3) 1 1 
2 Max-pool I (2, 2) 2 0 
3 Conv II (3, 3) 1 1 
4 Max-pool II (2, 2) 2 0 
5 Conv III (3, 3) 1 1 
6 Max-pool III (2, 2) 2 0 
7 Conv IV (3, 3) 1 1 
8 Max-pool IV (2, 2) 2 0 
3.4 ”训练 策略 
在 FMFI 中 , 定义 8 为 模型 参数 , fy 为 函数 表示 . 
FMFI 旨 在 根据 已 知 工 况 多 种 轴承 状态 类 型 的 样 
本 学 习 先 验 知识 、 优 化 模型 参数 gp, 实现 在 未 知 的 
复杂 工 况 下 准确 快速 的 故障 分 类 . 在 元 训练 阶段 ， 
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> {ulg foo (w)+(1—y) Ig [1—foo(a)]} , 
(Œy D's, 


(5) 


其 中 外 表示 任务 入 的 初始 化 任务 模型 参数 ，z 表 
示 属 于 任务 丈 中 的 支撑 集 Dz 的 所 有 数据 样本 ， 
jeo(z) 表 示 对 应 样本 输入 z 的 预测 标签 值 , y 表 示 对 
应 样本 输入 z 的 真实 标签 值 . 利用 交叉 焙 方 式 计算 
损失 函数 可 以 评估 模型 对 输入 样本 的 预测 能 力 , 使 
模型 的 预测 结果 能 够 更 好 地 远近 真实 标签 值 . 

假设 内 循环 中 , 每 个 任务 的 梯度 会 更 新 m 步 (m 
> 0), WES FARMAN Za, 其 任务 模型 
参数 的 更 新 公式 如 下 : 


Om-! 


0 = 07° PALL 


2 2 


—Y — OV gm-1.Z(D ), 
四 


HOM RANE THE Bm MES SACL GR: 
0 表示 任务 宛 在 第 mm 步 时 的 初始 化 任务 模型 参 
数 , 同时 也 是 在 第 m - 1 步 的 任务 参数 更 新 结果 ; 
a 表示 学 习 率 , 用 以 控制 每 个 任务 参数 更 新 的 步 长 ; 

Vgm-1-£;(D'y,, 07" ) 表 示 在 当前 任务 参数 0 F, 
FEZ ZAE ]SCPER DS, EIR KGAA Ot 
FESS HOT" ARBRE. 


通过 将 损失 求 和 , 将 (6) 式 进行 改写 , 得 到 模型 
在 任务 色 经 历 了 m 步 的 梯度 更 新 后 的 最 终 的 任务 
模型 参数 0” 的 另 一 种 形式 .: 
m=i 
or = 0 — E Vu LDz). (7) 
j=0 
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待 任务 参数 更 新 完 后 , ATS ZN AAR 
DD 和 进行 FMFI 在 任务 到 的 损失 计算 , 结合 (7) 式 得 
到 的 经 历 m 步 的 梯度 更 新 后 的 最 终 任务 参 数 0m, 损 
失 计 算 方法 如 下 : 


m—1 
j=0 
FMFI 在 元 训练 阶段 构建 n 个 任务 , 待 对 所 有 任 
务 进行 内 循环 后 , 可 以 得 到 n 个 任务 模型 参数 gm, k 
= 1,2,- ,n. FMFI 在 元 训练 阶段 的 外 循环 中 , 会 
基于 每 个 任务 对 应 的 查询 集 D 和 对 应 的 更 新 后 
任务 模型 参数 gm, 求 取 总 损失 函数 , 从 而 更 新 FMFTI 
的 模型 参数 gp, 得 到 更 新 结果 VY'. 更 新 方式 可 表示 
为 : 


(8) 


¢ = $ — BVg-Lemri(¢) 


= 9 BV 6 >》 Lert, (DS, , 0, o) ’ 


k=1 


(9) 


其 中 6 代表 元 学 习 率 , 用 于 控制 模型 参数 的 更 新 步 
长 . 
FMFI 在 元 测试 阶段 对 未 知 工 况 的 轴承 故障 进 
行 辨 识 时, 将 利用 训练 阶段 得 到 优化 模型 参数 作为 
测试 阶段 初始 参数 gp, 随机 抽取 数据 组 成 多 个 测试 
任务 . 利用 每 个 测试 任务 中 的 支撑 集 微调 模型 , 查 
询 集 测试 模型 性 能 . FMFI 的 目标 是 最 小 化 模型 在 
所 有 测试 任务 查询 集 的 元 损失 函数 .mei, 元 损失 
函数 .mp1 的 计算 公式 如 下 : 


ID 多 | 


1 
Leuri(DS, ¢) = D3] 5 Leurn (DG, 0), 
i f= 1 


(10) 


RPD RAB MAES WR, [Dy | 表示 测试 
任务 的 数量 ， Lert, (DY 名) 表示 在 第 ! 个 任务 中 ， 
内 循环 更 新 完成 得 到 任务 的 模型 参数 9m 后 , 利用 该 
任务 的 查询 集 刀 多 计算 的 任务 损失 函数 -全 wrr. 最 
后 将 所 有 任务 的 损失 函数 进行 平均 作为 元 损失 函 
ALm Dh, o), 从 而 避免 极端 情况 . 
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A 实验 与 分 析 
4.1 ”数据 集 介绍 

大 口径 射电 望远镜 在 运行 时 , 方位 和 俯仰 会 不 
断 变化 , 并 且 望 远 镜 会 时 刻 受 环境 因素 和 自身 重力 
影响 , 因此 俯仰 轴承 承受 的 载荷 也 是 变化 的 . 基于 
此 , 本 研究 选择 了 工 况 具有 相似 性 的 变 负载 轴承 识 
别 数 据 集 进行 实验 , 分 析 本 文 算法 的 效果 . 
目前 , 凯 斯 西 储 大 学 (Case Western Reserve 
University，CWRU) 的 轴承 故障 数据 库 是 轴承 故 
障 识别 中 常用 的 数据 集 , 广泛 应 用 于 故障 识别 领 
域 , 常 被 作为 评估 故障 分 类 性 能 的 基准 数据 集 吕 11. 
CWRU 数 据 集 测 量 不 同 负载 下 的 轴承 振动 信号 , 实 
验 工 况 接近 射电 望远镜 俯仰 轴承 的 运行 状况 , 均 为 
变 负 载 特性 . CWRU 数 据 实验 装置 示意 图 如 图 3 所 
示 , 主要 由 左 侧 的 电机 和 轴承 块 、 中 间 的 扭矩 传 感 
器 、 右 侧 的 负载 和 测 力 计 以 及 图 中 未 显示 出 的 电 
子 控制 设备 组 成 . 


Acceleration Sensor 


> 


Dynamometer 


Torque Sensor 


Motor Bearing Load 


Ve 


3 凯 斯 西 储 大 学 轴承 故障 试验 台 示 意图 


Fig.3 Diagram of the CWRU bearing fault testbed 


图 


CWRU RAO 1 
同 的 轴承 负载 (Load) 工 况 , 可 以 分 别 对 应 射电 望 远 
镜 运行 时 轴承 所 承受 的 不 同 载荷 . CWRU 数 据 集 通 
过 在 轴承 的 外 圈 、 内 圈 以 及 轴承 滚珠 部 分 进行 故 
障 加 工 , 模拟 轴承 的 磨损 等 失效 表现 , 并 根据 磨损 
程度 的 不 同 , 设置 了 不 同 的 故障 程度 . 通过 固定 在 
轴承 块 顶 部 的 加 速度 传感器 采样 测试 数据 , 信号 的 
采样 率 设置 为 12 kHz. 在 4 种 不 同 负载 工 况 下 , 分 别 
对 正常 和 损伤 的 轴承 块 进行 测试 , 在 每 种 负载 下 均 
包含 3 种 内 圈 故 障 状态 、3 种 外 圈 故 障 状态 、3 种 滚 
动 体 故障 状态 以 及 1 种 正常 状态 , 共 10 种 轴承 状态 


类 型 . 


2、3 马 力 (hp) 共 4 种 不 
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4.2 ”任务 设置 

在 射电 望远镜 实际 运行 过 程 中 , 天 线 工 况 总 是 
不 断 变化 . 为 了 使 模型 能 够 应 对 天 线 不 同 的 工作 状 
况 , 需 对 模型 在 变化 工 况 下 的 通用 性 进行 实验 验 
证 . 根据 本 文 提 出 的 FMFI 的 任务 构建 方法 , 基于 相 
似 的 变 工 况 下 的 CWRU 数 据 集 构建 实验 任务 . 经 调 
研 相关 研究 , 不 同 工 况 下 的 故障 数据 存在 一 定 的 特 
征 差异 , 因此 可 以 使 用 不 同 工 况 下 的 数据 集 , 构 
建 元 学 习 任 务 集 , 组 织 元 训练 和 元 测试 过 程 . 这 有 
利于 FMFI 学 习 更 多 通用 的 故障 知识 , 从 而 实现 未 
知 工 况 下 的 故障 辨识 . 

为 验证 FMFI 方 法 在 辨识 未 知 工 况 下 的 故障 性 
能 表现 , 依照 元 学 习 任 务 组 织 方式 , 将 数据 按照 
负载 工 况 划 分 为 T0-T3 共 4 种 任务 . 每 种 工 况 均 包 
括 10 种 轴承 状态 类 型 . FMFI 在 已 知 工 况 下 进行 元 
学 习 , 在 未 知 工 况 下 进行 故障 辨识 测试 . 详细 的 
任务 设置 见 表 2 所 示 . 例如 任务 T0 是 指 模型 在 负载 


(a) 


为 0 所 对 应 的 数据 集 上 训练 , 并 在 负载 为 1 所 对 应 的 
数据 集 上 验证 以 推广 模型 性 能 , 最 后 在 负载 为 3 所 
对 应 的 数据 集 上 测试 . 


表 2 基于 CWRU 轴 承 数据 集 的 故障 辨识 场景 
Table 2 Fault identification scenarios on CWRU 


datasets 
Validation Set 


Task Training Set Testing Set 


TO Load 0 Load 1 Load 3 
T1 Load 0 Load 1 Load 2 
T2 Load 0 Load 3 Load 1 
T3 Load 3 Load 1 Load 0 


原始 的 一 维 故障 时 域 信号 通过 CWT 方 法 变 为 
时 频 图 像 , 每 种 状态 类 别 包含 115 张 时 频 图 像 , 如 
图 4 分 别 给 出 了 内 圈 故 障 、 外 圈 故 障 和 滚动 体 故 障 
的 时 频 图 像 . 


(9) 


图 4 ”3 种 不 同 故障 类 型 的 时 频 图 像 . (a) 内 


圈 故 障 ，(b) 外 圈 故 障 ，(c) 滚 动 体 故障 . 


Fig.4 Time-frequency images of three different types of faults. (a) Inner ring fault, (b) Outer ring fault, (c) Rolling body fault. 


根据 FMFT 方 法 的 元 学 习 训练 方式 , 按照 5-way 
1-shot (或 5-shot) 的 方式 从 每 种 工 况 的 时 频 图 中 抽 
取 数 据 , 并 将 其 组 合 为 任务 进行 训练 . 每 个 任务 包 
含 5 类 故障 形式 , 每 一 类 故障 形式 的 支撑 集 数目 为 
1 (对 应 1-shot) 或 者 5 (对 应 5-shot). FMFI 的 学 习 率 
Q、 元 学 习 率 6 以 及 元 训练 的 迭代 次 数 分 别 设置 
为 0.04、0.0002、300. 模型 在 训练 阶段 ， 每 10 个 
epoch 采 用 验证 集 微调 模型 , 使 模型 能 够 在 训练 
集 和 验证 集 上 都 有 较 好 的 效果 ; 在 测试 阶段 , 选择 


1000 个 测试 任务 的 平均 精度 作为 本 次 最 终 测试 
精度 ,从 而 避免 极端 结果 . 对 比 的 基线 方法 选择 
CNN, 训练 过 程 的 迭代 次 数 同 为 300, 基于 10 种 故 
障 的 所 有 时 频 图 进行 训练 、 验 证 以 及 测试 , FM- 
FI 与 CNN 的 网 络 模型 结构 均 参 照 表 1 设置 . 


4.3 ”结果 分 析 
FMFI 依 照 表 2 所 示 的 场景 任务 进行 训练 测试 ， 
在 每 个 任务 下 , FMFI 在 一 个 工 况 下 进行 训练 , 并 在 
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新 的 工 况 下 分 别 进行 验证 和 测试 . 
首先 对 FMFI 的 支撑 集 数目 (shot) 进 行 测试 , 探 
究 支 撑 集 数 目 对 结果 的 影响 . 在 任务 TO 下 , 设置 5- 


way K-shot 中 KK 分别 取 1 和 5. 观察 FMFI 在 元 训练 
过 程 和 元 验证 过 程 中 准确 度 和 损失 的 变化 . 实验 结 
果 如 图 5 所 示 . 


一 一 1-shot Training Accuracy 


一 一 5-shot Training Accuracy | 


Accuracy 
> 


Accuracy 
o o 


一 一 1-shot Validation Accuracy 
一 一 5-shot Validation Accuracy 


150 
Epochs 


(a) 


Epochs 
(b) 


一 一 1-shot Training Loss 


08 一 一 5-shot Training Loss | 


— 1-shot Validation Loss 
0.8 H —— 5-shot Validation Loss 


Epochs 
(c) 
45 FMFI 在 任务 TO0 上 的 元 训练 和 元 验证 过 


>H 


=. (a) 元 训练 过 程 的 精度 


线 , (bp) 元 验证 过 程 的 精度 


程 的 损失 


Epochs 
(d) 


线 ，(c) 元 训练 过 程 的 损失 曲线 ，(d) 元 验证 过 


Fig.5 The meta-training and meta-validation process of FMFI under the Task TO. (a) Meta-training accuracy curves, (b) 


Meta-validation accuracy curves, (c) Meta-training loss curves, (d) Meta-validation loss curves. 


由 图 5 可 以 发 现 , 无 论 在 训练 过 程 还 是 在 验证 
过 程 中 , 支撑 集 数 目的 改变 并 不 会 影响 准确 率 和 损 
失 的 变化 趋势 但 支撑 集 数 目的 增加 能 够 显著 缩短 
模型 达到 最 终 收敛 的 时 间 . 在 图 中 可 以 明显 发 现 ， 
相 比 于 1-shot 在 5-shot 情 况 下 , 模型 的 收敛 速度 更 
快 , 起 始 准确 率 上 升 、 起 始 损失 下 降 , 可 以 在 更 短 
时 间 内 获得 准确 度 更 高 的 模型 . 这 是 由 于 支撑 集 数 
目的 增加 可 以 使 模型 在 每 次 学 习 时 获取 更 多 的 信 
FS, 帮助 模型 实现 快速 准确 的 故障 辨识 . 

在 分 析 FMFI 的 支撑 集 数目 对 训练 和 验证 过 程 
以 及 结果 的 影响 后 , 本 文 进一步 探讨 多 任务 下 , 3 
撑 集 数目 对 于 测试 结果 的 影响 , 并 以 CNN 方 法 作为 
基线 对 比方 法 , 检验 元 学 习 框架 的 有 效 性 . 

在 模型 测试 时 , 为 降低 实验 偶然 性 , 减 小 随机 
RE, 重复 执行 FMFI 方 法 与 CNN 方 法 10 次 , 选取 
平均 值 作为 测试 的 最 终 精 度 . 测试 结果 如 表 3 和 图 6 


所 示 . 
根据 表 3 和 图 6 所 示 的 不 同方 法 在 4 种 任务 下 的 
结果 对 比 , 可 以 发 现在 4 组 变 工 况 的 任务 下 , FM- 
FI 方法 的 性 能 都 较 好 , 且 性 能 稳定 , 平均 精度 可 达 
到 95% 以 上 . 而 CNN 方 法 的 精度 会 随 着 任务 的 变 
化 而 波动 , 平均 精度 在 90% 以 下 . 特别 是 在 T3 任 务 
H, FMFI 的 准确 率 达 到 98.8%, 比 作 为 基线 的 CNN 
方法 提高 了 26.13%. 

传统 的 机 器 学 习 方法 主要 针对 特定 任务 训练 ， 
需要 较 多 的 样本 , 获取 的 轴承 辨识 知识 有 限 , 不 足 
以 对 未 知 新 工 况 下 的 故障 进行 分 类 . 表 3 和 图 6 表明 ， 
基于 元 学 习 的 FMFI 方 法 相 较 于 CNN 方 法 , 在 面临 
不 同 分 布 的 数据 时 , 能 够 学 习 到 更 多 的 通用 故障 特 
iE, 具有 更 强 的 泛 化 性 能 , 能 够 在 新 工 况 下 实现 准 
外 分 类 , 完成 跨 工 况 的 故障 辨识 . 基础 的 CNN 方 法 
昌 于 参数 更 新 设置 简单 , 在 面临 训练 数据 域 与 测试 
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数据 域 的 来 源 不 同时 , 提取 的 特征 有 限 , 难以 将 从 
训练 数据 得 到 的 知识 进行 推广 , 辨识 未 知 工 况 的 故 
障 时 效果 欠 佳 . 

此 外 , 根据 表 3 和 图 6 还 可 以 发 现 , 相对 于 任务 
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Tl 和 T2, 两 种 方法 在 任务 T0 和 T3 上 的 精度 略 有 过 
色 , 这 或 许 是 因为 相对 于 任务 T1 和 T2, 任务 T0 和 
T3 训 练 集 和 测试 集 的 负载 差异 较 大 , 导致 根据 训练 
集 所 学 到 的 知识 在 测试 集 下 无 法 发 挥 全 部 作用 . 
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6 ”不 同方 法 在 不 同 任务 下 的 比较 结果 (FMFI 方 法 稳定 性 较 高 , 误差 较 小 , 图 中 不 明显 ). 


Fig.6 The compared results of different methods under variable tasks (FMFI method is more stable, has fewer errors and the 


error is not as obvious in the graph). 


表 3 不 同方 法 在 不 同 任务 下 的 测试 精度 


Table 3 Test accuracy of different methods under variable tasks 


Task 
TO T1 T2 T3 
Method 
CNN 75.03% + 3.84% 87.83% + 2.74% 88.89% + 3.47% 72.67% + 6.76% 
FMFI 1-shot 95.32% + 0.16% 99.35% + 0.05% 98.01% + 0.10% 96.22% + 0.21% 
FMFI 5-shot 98.30% + 0.04% 99.74% + 0.03% 99.14% + 0.04% 98.80% + 0.06% 
5 ”结语 务 上 的 辨识 性 能 高 于 基线 方法 , 在 复杂 工 况 下 具有 


本 文 提出 了 基于 元 学 习 的 大 口径 射电 望远镜 
俯仰 轴承 的 故障 辨识 方法 FMFTI, 实现 了 复杂 未 知 
工 况 下 利用 少数 样本 进行 准确 、 快 速 的 故障 辨识 . 
根据 望远镜 运行 时 工 况 不 断 变化 的 特性 , 选择 了 类 
似 工 况 的 CWRU 数 据 集 进 行 实验 , 设计 了 4 个 模拟 
俯仰 轴承 复杂 工 况 的 实验 任务 , 并 使 用 CNN 方 法 作 
为 基线 对 比 . 对 比 结果 表明 , FMFI 方 法 凭借 其 自学 
习 能 力 , 得 到 的 模型 泛 化 性 能 较为 优异 , 在 多 个 任 
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很 高 的 辨识 准确 性 和 可 靠 性 . 本 文 的 工作 可 为 大 口 
径 射 电 望 远 镜 俯 仰 轴承 的 故障 辨识 提供 一 种 可 行 
的 参考 方法 , 同时 也 可 为 俯仰 轴承 的 动态 运 维 以 及 
高 性 能 服役 提供 重要 支撑 . 

致谢 感谢 审 稿 人 对 文章 提出 的 宝贵 建议 , 使 得 文 
章 的 质量 有 了 显著 的 提高 . 感谢 CWRU 数 据 库 的 协 
助 . 感谢 实验 室 提供 的 实验 条 件 . 
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Research on Fault Identification Method of Elevation Bearing for 
Large Aperture Radio Telescope Based on Meta Learning 


ZHU Jin-haol2 XU Qian! XUE Feit? HE Fei-longt? LIANG Juant? XU Duo-xiang!? 
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(2 University of Chinese Academy of Sciences, Beijing 100049) 
(3 Key Laboratory of Radio Astronomy, Chinese Academy of Sciences, Urumqi 830011) 
(4 Xinjiang Key Laboratory of Radio Astrophysics, Urumqi 830011) 


Asstract The prolonged operation of the large aperture radio telescope will lead to slight distortion 
of elevation axis, increasing the risk of fatigue of the rolling bearing which is the core component of the 
elevation axis. This can lead to a decline in the bearing life and the pointing accuracy of the telescope, 
which will greatly affect the telescope’s high performance service. Investigating the fault identification 
method for the elevation bearing can provide an important support for the high-performance operation 
of the telescope antenna. In this paper, a few-shot meta-learning fault identification (FMFI) method 
based on meta-learning is proposed in order to achieve accurate fault identification of elevation bearing 
under limited data and complex working conditions. The raw signals of different working conditions are 
first converted to time-frequency images data and then randomly sampled for different learning tasks 
according to the meta-learning protocol. Under limited sample data condition, the FMFI method can 
obtain universal prior knowledge from the sample in the training task to achieve accurate and fast fault 
identification in unknown testing tasks. The variable load bearing data set which is similar to the working 
condition of telescope elevation bearing is selected for experiment, and the experimental results show that 
the FMFI method is high accurate and reliable, providing strong technical support for the operation, 
maintenance, and high-quality service of large aperture radio telescope. 


Key words telescope, instrumentation: elevation bearing, methods: data analysis, methods: pattern 
recognition 
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